AI产业链地图·知识库 边缘 AI · 概念

🚧 网站建设中更新 2026·06·17 登录 / 注册 → 产业链图谱

首页/概念/边缘 AI

更新 2026·06·17

概念技术 / 术语

边缘 AI

Edge AI · 边缘 AI 推理 · Edge AI Inference · 边缘推理

2. 节省回源带宽 — 大量"短小高频"请求不必跨大洲传输 3. 数据主权 — 用户数据可不出本地区 4. 首字时延（TTFT）大幅改善 — LLM Streaming 用户体验关键指标

边缘 AI CONCEPT · 概念

首次提出: 2020
关键参与方: [[Cloudflare]] · [[Akamai]] · [[Fastly]] · [[网宿科技]]
反向引用: 22 处 · 来自 18 页

归属边缘AIEdge-AIAI推理第三层

边缘 AI / 边缘 AI 推理（Edge AI / Edge AI Inference）

定义

边缘 AI 推理是把训练好的 AI 模型（LLM / 视觉 / 语音 / 推荐）部署到 ↑ up::CDN 边缘节点或运营商 MEC 节点上，让推理请求就近响应而不必回传到中心化 GPU 集群。核心收益：

延迟从 300-1,000ms 降至 30-100ms — 实时对话/语音/视频 AI 体验可用
节省回源带宽 — 大量"短小高频"请求不必跨大洲传输
数据主权 — 用户数据可不出本地区
首字时延（TTFT）大幅改善 — LLM Streaming 用户体验关键指标

2026 年被业内定义为"边缘智能全面爆发年"，CDN 节点全面升级为 AI 推理节点。

关键产品

海外

厂商	产品	特色
Cloudflare	Workers AI + AI Gateway	Serverless 边缘 GPU / 多模型路由
Akamai	AI 推理云（41 DC + NVIDIA B200）	2026 CIS +45-50% 增长
Fastly	语义缓存 + 高算力边缘编排	首年盈利 $1,970 万
NVIDIA	NIM / Triton on Edge	模型容器化

中国

厂商	产品	特色
网宿科技	Moltbot 边缘 AI 平台	2,800+ 全球节点
云工场科技	灵境云边缘智算	"十公里低时延算力服务圈"
阿里云	边缘节点服务（ENS）	国内最广

与中心 AI 的差异

维度	中心化 AI（云端）	边缘 AI
模型规模	100B-2T 参数（如 GPT-4 / Claude）	1B-70B 蒸馏 / 量化模型
单次推理时延	300-1,500ms	30-100ms
带宽消耗	高	低
单次成本	高	低（高 QPS 摊薄）
适用场景	复杂 reasoning / 长上下文	实时对话 / RAG / 短任务

关键技术

模型压缩 — INT4/INT8 量化、剪枝、蒸馏（→ 4-04-模型部署与优化）
语义缓存（Fastly 核心技术） — 把语义相似的 prompt 命中已有结果，降低 GPU 调用
混合架构 — 云训练-边缘推理，训练在中心、推理在边缘
Serverless GPU 编排 — 按请求计费的 GPU 算力

行业趋势

CDN 厂商全面 AI 化 — Cloudflare/Akamai/Fastly 三家 AI 营收占比 2024 普遍 <5% → 2027E 预期 15-25%
AI Gateway 成新入口 — AI Gateway 解决"多模型/多供应商"统一访问层
75% 数据在边缘（IDC 2025E）— 推理就近成大势所趋
混合云架构标配 — 大模型公司（如 OpenAI / Anthropic）也开始 CDN 边缘部署

关联

↑ up::2-01-核心逻辑芯片 CDN ↓ down::第五层应用（自动驾驶 / AR-VR / 实时翻译 / 工业视觉） ∈ belongs_to::3-04-边缘节点-网络分发基础设施

反向引用链接到本页

反向引用 22

按引用量 ↓

… ] CDN — 中国第一 **24%**，2015 降价 21% 引发 10 年价格战 - [[腾讯云]] CDN — 中国第三，游戏/社交场景优势 ## 核心技术维度 1. **服务形态**：[[CDN]] / [[边缘计算]] / 边缘 AI / [[边缘云]] 2. **Serverless 边缘**：[[Cloudflare Workers]] / [[Fastly Compute]] / [[Serverless 边缘函数]] …

… orkers]] / [[Fastly Compute]] / [[Serverless 边缘函数]] 3. **边缘 AI**：[[AI Gateway]] / [[Workers AI]] / [[Serverless GPU]] / 边缘 AI 推理4. **安全**：[[SASE]] / [[WAAP]] / [[Cloudflare One]] / [[零信任]] / [[DDoS 防护]] 5. **关键技术**：[[语义缓存]]（Fastly） / [[智能调度算法]] / …

查看原文 →

… 安防双寡头 [[海康威视]] 37% + [[大华股份]] 18% 合计 55%；数字孪生极度分散（CR3 仅 31%），整合空间巨大** ## 一句话定位智慧城市/AIoT 是把边缘 AI + [[数字孪生]] + [[5G+MEC]] 深度融合，构建"端-边-云"三层架构覆盖城市治理 / 智能安防 / 智慧交通 / 数字孪生 / 应急指挥 / 智能家居等场景的 AI 应用赛道。 …

… 1. **端-边-云三层架构**：[[端-边-云三层架构]] / [[IoT 终端]] / [[边缘计算]] / [[城市大脑]] 2. **边缘 AI 算力**：边缘 AI / [[TinyML]] / [[地平线征程]] / [[华为昇腾]] / [[NVIDIA Jetson]] 3. **5G+MEC**：[[5G+MEC]] / [[多接入边缘计算]] / [[运营商 MEC]] …

查看原文 →

… 1. **超低延迟场景驱动** — 自动驾驶 / AR-VR / 实时 AI 2. **Serverless 抽象成标配** — 开发者无需关心节点位置 3. **AI 工作负载下沉** — 边缘 AI 推理成核心增长引擎 4. **区县级节点战略价值** — 中国"东数西算"+ 县级数字化推动 ## 关联 ↑ up::[[3-03-数据中心]] ↓ down::[[边缘 AI]] [[Serverless 边缘函数]] …

… 3. **AI 工作负载下沉** — [[边缘 AI 推理]] 成核心增长引擎 4. **区县级节点战略价值** — 中国"东数西算"+ 县级数字化推动 ## 关联 ↑ up::[[3-03-数据中心]] ↓ down::边缘 AI [[Serverless 边缘函数]] ∈ belongs_to::[[3-04-边缘节点-网络分发基础设施]] …

查看原文 →

… - [[中国电信]] / [[中国移动]] / [[中国联通]] — 运营商 MEC ## 关联 ↑ up::[[CDN]] [[3-03-数据中心]] ↓ down::边缘 AI [[边缘 AI 推理]] ∈ belongs_to::[[3-04-边缘节点-网络分发基础设施]] …

… - [[中国电信]] / [[中国移动]] / [[中国联通]] — 运营商 MEC ## 关联 ↑ up::[[CDN]] [[3-03-数据中心]] ↓ down::[[边缘 AI]] 边缘 AI 推理∈ belongs_to::[[3-04-边缘节点-网络分发基础设施]] …

查看原文 →

… - **端侧** — IoT 终端（智能摄像头、环境传感器、车载终端、智能井盖等），2025 全球 IoT 设备数 **450 亿台**，中国占 **30%+** - **边缘** — 边缘 AI 节点实现毫秒级处理，端到端时延 **<10ms** - **云端** — [[城市大脑]] 算力平台与决策中枢 ## 核心技术能力 1. **[[计算机视觉]]** — 2024 中国 CV 应用市场￥123.4 亿（YoY +21 …

查看原文 →

… - **电商**：[[阿里巴巴]] / [[京东]] 图片视频分发 - **游戏**：补丁/资源下载、实时联机加速 - **AI 推理**：边缘 GPU 节点提供低延迟模型服务（边缘 AI 推理） ## 行业趋势 1. **从"内容分发"到"边缘智能"** — 2026 边缘智能爆发年，节点升级为 AI 推理节点（[[Cloudflare]] AI Gateway / [[Akamai]] Blackwell / [[网宿科技 …

查看原文 →

… > 实践中两者交叉融合，部分 CityOS 包含城市大脑能力，反之亦然。 ## 与 AI 产业链关系 ↑ up::[[3-01-云计算与智算平台]] — 算力底座 ↑ up::[[AIoT]] 边缘 AI — 端边能力 ↓ down::智慧社区 / 智慧园区 / 智慧文旅 / 应急指挥等应用 ∈ belongs_to::[[5-05-智慧城市-AIoT]] …

查看原文 →

… 4. **与 Next.js / Astro 框架深度集成** — 前端框架默认部署到边缘 ## 关联 ↑ up::[[CDN]] [[边缘云]] ↓ down::边缘 AI 推理∈ belongs_to::[[3-04-边缘节点-网络分发基础设施]] ## 已废弃叙述 <details> <summary>2026-05-29 数字订正：Fastly Compute@Edge 推出年份 2020 → 2019（ …

查看原文 →

… - 海外（Microsoft Azure IoT / AWS IoT Greengrass） ## 与 AI 产业链关系 ↑ up::[[3-01-云计算与智算平台]] 边缘 AI — 算力 + 端侧 ↓ down::智慧社区 / 园区 / 文旅 / 应急应用 ∈ belongs_to::[[5-05-智慧城市-AIoT]] …

查看原文 →

… - **催生端侧 AI 部署需求**：推动 [[中科创达]] / [[Qualcomm]] / [[联发科]] / 高端手机 OEM 等环节估值重估 ## 相关概念 - [[端侧AI]] - 边缘 AI- [[知识蒸馏]] - [[模型量化]] - [[轻量化模型]] ∈ belongs_to::[[4-04-模型部署与优化]] …

查看原文 →

… . **混合编排框架** — [[LangChain]] / [[LiteLLM]] / [[Vercel AI SDK]] 默认支持多端部署 ## 关联 ↑ up::[[CDN]] [[3-01-云计算与智算平台]] ↓ down::边缘 AI [[AI Gateway]] ∈ belongs_to::[[3-04-边缘节点-网络分发基础设施]] …

查看原文 →

… ## 与 AIoT 产业链关系 ↑ up::[[3-01-云计算与智算平台]] [[2-01-核心逻辑芯片]] — 算力底座 ↑ up::[[计算机视觉]] [[数字孪生]] 边缘 AI — 核心算法 ↓ down::政府治理 / 应急管理 / 交通调度 / 公共安全 ⚔ competitor::[[阿里云]] vs [[商汤科技]] 方舟 vs [[百度集团]] ACE …

查看原文 →

… - 2025 全球 IoT 设备 **450 亿台**，中国占 30%+ - 单摄像头边缘算力从 2020 **0.5 TOPS** → 2025 **5 TOPS**（10×） ### 边缘层（边缘 AI） - 在数据源附近部署的边缘计算节点 - **毫秒级实时处理**，时延从云端的 100-200ms 降至 **<10ms** - 自动驾驶、应急指挥等场景的刚需 …

查看原文 →

… 次尝试在端侧而非云端运行 AI agent，与其一贯的端侧优先战略一致（[据](../来源摘要/苹果再次尝试端侧运行AI而非云端（端侧agent讨论）.md.md)）。 ## 相关概念 - [[云-边-端协同]] - 边缘 AI- [[模型量化]] ∈ belongs_to::[[4-04-模型部署与优化]] …

查看原文 →

… CDN 产品**涨价 35-40%**，标志中国 CDN 行业经过 10 年价格战后头部厂商**回归合理定价权** - 边缘计算平台 ECP（Edge Computing Platform）— 把 GPU/NPU 算力部署到边缘节点支持边缘 AI 推理- AI 助手 **Moltbot** — 网宿自研的 AI 运维/客服助手，承载边缘 AI 应用场景探索 ### 2. 安全业务（高毛利核心增长极） - **毛利率 77.23%** vs CDN 31.93%，是公司战略转型的"利润 …

查看原文 →

… - 服务于直播、点播、长视频、游戏分发等大带宽场景 ### 2. 星域云边缘计算 - 把轻量级 AI 推理 / 数据预处理任务下沉到家庭节点 - 探索新一代"分布式边缘 AI 推理"基础设施 ### 3. 硬件生态 - 与 [[小米]] 等硬件厂商合作的硬件预装与硬件出货分成 ## 核心技术 — "无限节点" - 与 [[网宿科技]] 等机房节点路线**根本不同**：节点不是几千个机房 IDC，而是**千万个家 …

查看原文 →

… 3. **CDN 厂商抢占边缘语义缓存高地** — Fastly / Cloudflare 首发优势 ## 关联 ↑ up::[[AI Gateway]] 边缘 AI↓ down::[[OpenAI]] [[Anthropic]] ∈ belongs_to::[[3-04-边缘节点-网络分发基础设施]] …

查看原文 →

… - **响应速度** — 本地推理延迟更低 - **离线可用** — 弱网/无网环境保持基础搜索能力 ## 关联 - 基础技术：[[RAG]] / [[模型量化]] / 边缘 AI- 跨子行业：第四层 [[4-04-模型部署与优化]] / 第五层 5-07 - 关键玩家：[[NVIDIA]] Jetson / Apple Intelligence / [[华为]] 盘古 …

查看原文 →